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(57) Abstract 

The invention concerns the targeted insertion of a foreign DNA in a site selected in the genome of eucaryote cell. The in- 
sertion site selected is found in a gene. The targeted insertion is accomplished by transfecting eucaryote cells with a vector con- 
taining the foreign DNA to be inserted flanked by two genomic sequences which are adjacent to the desired insertion site in the 
receiver gene. The DNA to be inserted may comprise either a coding sequence, or a regulating sequences. The flanking sequences 
are chosen so as to allow via homologus recombination, according to the case, either the expression of the coding sequence of the 
DNA to be inserted under to control of regulating sequences of the receiver gene, or the expression of a coding sequences of the 
receiver gene under the control of the regulating sequence of the DNA to be inserted. 

(57) Abrege 

L'invention concerne ['insertion ciblee d'un ADN etranger a un site choisi dans Ie genome d'une cellule eucaryote. Le site 
d'insertion choisi se trouve dans un gene. L'insertion ciblee est effectuee en transfectant des cellules eucaryotes avec un vecteur 
contenant L'ADN etranger a inserer flanque de deux sequences genomiques qui jouxtent le site d'insertion souhaite dans le gene 
receveur. L'ADN d'insertion peut comporter soit une sequence codante, soit une sequence regulatrice. Les sequences flanquantes 
sont choisies afin de permettre par recombinaison homologue, selon le cas, soit l'expressiori de la sequence codante de l'ADN 
d'insertion sous le controle des sequences regulatrices du gene receveur, soit l'expression d'une sequence codante du gene rece- 
veur sous le controle de sequence regulatrice de l'ADN d'insertion. 
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PROCEDE DE EMPLACEMENT SPECIFIQUE D'UNE COPIE D'UN 
GENE PRESENT DANS LE GENOME RECEVEUR PAR 
L 1 INTEGRATION D'UN GENE DIFFERENT DE CELUI OU SE FAIT 
L • INTEGRATION 

5 

L' invention concerne un precede de replacement 
specif ique d'une copie d'un gene prdsent dans le 
genome d'un organisme eucaryote receveur par 
1 1 integration d'un gene different du gene inactive. 
De preference, le gene receveur sera present en au 
moins 2 exemplaires dans la cellule hote transfectee. 
Le gene receveur est defini comme etant le gene ou se 
fera l 1 insertion du gene different. 

Plus particulierement, 1' invention concerne la 
production d 1 animaux transgeniques dans lesquels le 
gene etranger a ete introduit d'une maniere ciblee 
pour permettre, a la fois, le maintien des fonctions 
genetiques normales de 1' animal et 1' expression du 
gene etranger sous le controle de promoteurs 
20 endogenes. 

* 

Par "gene different ou etranger" on entend toute 
sequence nucleotidique correspondant a la totalite ou 
a une partie d'un gene "etranger ou different" du 
gene recepteur telle qu'elle est trouvee normalement 
dans le genome (ARN ou ADN) , ou elle correspond 
egalement a une sequence modifiee artif iciellement du 
gene normal ou encore a un fragment de cette 
sequence . 

L 1 invention concerne egalement le precede de 
production de ces animaux transgeniques. 

Dans la production d' animaux transgeniques, les 
methodes conventioimelles utilisees pour 

1 ' introduction de sequences d'ADN heterologues dans 
la lignee cellulaire germinale, ne permettent pas de 
controler le site de 1 • integration du gene etranger 
dans le genome, ni le nombre de copies ainsi 
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introduit. L 1 integration du gene etranger se fait au 
hasard et, en general, plusieurs copies du gene 
s'integrent en meme temps, parfois sous forme de 
tandem tete a queue, le site de 1 1 integration et le 
5 nombre de copies integrees variant d'un animal 
transgenigue a I 1 autre. 

II peut done arriver que des genes cellulaires 
endogenes, situes au point d 1 insertion, soient ainsi 
inactives, sans que cela soit facilement decelable en 

10 raison de nombreuses insertions au hasard. Si le 
produit de ces genes est important pour le 
developpement de 1' animal, celui-ci sera serieusement 
perturbe. D'ailleurs, I 1 insertion aleatoire du gene 
stranger peut se faire a un site qui n'est pas 

15 approprie pour 1' expression du gene. De plus, le fait 
qu'il y ait variation du site et du nombre 
d 1 insertions d 1 animal en animal rend 1 1 interpetation 
des etudes d 1 expression extremement difficile. 

Un probleme majeur rencontre dans la production 

20 d'animaux transgeniques, est I'obtention de 
l 1 expression du gene etranger. D'une maniere 
generale, deux types d 1 experience ont ete realises 
chez les souris. 

Les genes introduits dans la lignee germinale 

25 sont : 

- soit des genes "complets", comprenant des sequences 
codantes flanquees de leurs propres sequences 
regulatr ices ; 

- soit des genes composites, formes de la sequence 
30 codante d'un gene fusionn^e a la sequence promotrice 

d'un autre gene, les deux fragments appartenant meme 
parfois a deux especes animales differentes. 

On a pu ainsi confirmer que la specificite de 
l 1 expression des genes dans tel ou tel tissu est 
35 determinee par leur(s) s6quence(s) regulatrices . 
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Le choix du promoteur approprie pour 
1" expression du gene etranger chez 1 1 animal 
transgenique est done d'une importance primordiale. 

D' autre part, la mutagdnese dirigee de genes 
murins dans des cellules souches embryonnaires a 
recemment 6td realis6e en faisant appel a une 
technique de "ciblage genetique" (gene targeting) 
(Thomas et al., 1987; Thompson et al. f 1989) . 

Dans le premier cas, le gene murin HPRT a ete 
mute par insertion et remplacement et, dans le 
deuxieme cas, un gene HPRT mute a dte corrig£. 
Thomson et al. ont etendu leurs experiences jusqu'a 
I'obtention de souris chimeres et ont constate le 
passage de la modification genetique dans la lignee 
15 cellulaire germinale. 

Dans chacun des documents cites, le site precis 
de 1 1 integration a 6te cibl<§ par recombinaison 
homologue entre, d'une part, des sequences exogenes 
comportant la mutation ou correction incluses dans un 
20 vecteur, sous le controle d»un promoteur exbgene, et, 
d' autre part, leur homologue genomique. Ceci 6tant, 
il faut remarquer que les auteurs anterieurs ont 
realise leurs experiences sur un gene specif ique 

r 

(HPRT) dont 1' activation par mutation s 1 accompagnait 
25 d'un phenotype decelable. La mutation ciblee decrite 
par Thomas et al., avait pour effet d'inactiver le 
gene HPRT et, par consequent, de faire disparaltre le 
phenotype decelable normalement associd avec le HPRT. 
Le gene de selection Neo R , sous le controle d f un 
30 promoteur TK, etait done incorpore dans 1*ADN 
d' insertion afin de permettre la selection des 
transformants. II est a noter que les experiences 
decrites dans l«art ant6rieur impliquaient une 
selection soit par le gene receveur (p. ex HPRT) soit 
par le gene d 1 insertion (p. ex Neo R ) . Le site de 
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I 1 insertion et/ou le type de gene insure est done 
limite a des genes conferant un caractere selectable. 

En outre, dans I 1 art anterieur, les sequences 
exogenes sur le vecteur servent done a la fois a 
5 cibler le site d 1 integration et a introduire la 
modification. Suite a la recombinaison homologue, le 
gene modifi6 se trouve tou jours dans son 
environnement genetique normal. 

Rappelons qu'un probleme qui se pose au cours de 
10 la production d'animaux transgeniques est le danger 
d'inactiver un gene cellulaire endogene qui se trouve 
au point d 1 insertion du gene etranger. 

Selon la fonction du produit du gene inactive , 
une telle inactivation peut conduire a des desordres 
15 physiologiques ou morphologiques importants chez 
l 1 animal transgenigue, ou pourrait meme empecher sa 
survie. 

En revanche, 1 1 inactivation d'un g&ne pourrait 
etre considere comme avantageux si le gene en 

20 question codait pour un recepteur de virus ou autre 
agent infectieux. 

Les inventeurs ont etudie la possibility 
d'eviter les inconvenients deer its plus haut, et 
associes, dans certains cas, a 1 1 inactivation 

25 possible d'un ou plusieurs genes cellulaires endogene 
de fonction importante au cours de la production 
d 1 animaux transgeniques . 

L 1 invention a pour objet tin proc^de de 
r emplacement specif ique, notaxnment par ciblage d'un 

30 ADN, dit ADN d 1 insertion constitu6 par une partie 
d'un gene susceptible d'etre rendu fonctionnel, ou 
dont le fonctionnement peut fitre rendu plus efficace, 
lorsqu'il est recombine avec un ADN de complement 
pour alors fournir un gene recombinant complet dans 

35 le genome d'une cellule eucaryote, caracterise en ce 
que 
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- le site d 1 insertion se trouve dans un gene choisi, 
dit gene receveur, et contenant 1 1 ADN de complement, 
et en ce que 

- l'on transfecte des cellules eucaryotes avec un 
5 vecteur contenant un inserat comprenant lui-meme 

I 1 ADN d 1 insertion et deux sequences dites 
"flanquantes" de part et d' autre de I'ADN 
d 1 insertion, respectivement homologues a deux 
sequences genomiques qui jouxtent le site d 1 insertion 
10 souhaite dans le gene receveur, 

- 1 1 ADN d' insertion etant heterologue vis-a-vis du 
gene receveur, et 

- les sequences flanquantes, etant choisies parmi 
celles qui constituent le susdit ADN de complement et 

15 qui autorisent, par recombinaison homologue avec des 
sequences correspondantes du gene receveur, la 
reconstitution d'un gene recombinant complet dans le 
genome de la cellule eucaryote, 

L 1 invention concerne aussi un procede de 

20 production d'animaux transgeniques, caracterise en ce 
que des cellules E.S. sont transfectees dans les 
conditions sus-decrites et selectionnees pour 
1'evenement de recombinaison homologue, a savoir 
1 1 integration correcte du gene etranger, les cellules 

25 transfectees sont injectees dans des embryons. a un 
stade ou ils sont aptes a integrer les cellules 
transfectees (par exemple au stade blastocyste) , 
ceux-ci sont ensuite reimplantes dans une mere 
porteuse et les individus chimeres obtenus au terme 

30 de la gestation sont accouples. Si les cellules E.S. 
ont colonise la lignee germinale de l 1 animal chimere, 
des animaux transgeniques heterogozytes pour le gene 
remplace seront obtenus par accouplement (Fl) dans la 
descendance. 

35 II est egalement possible d'inserer le gene, 

porte par le vecteur de !• invention, dans l'oeuf peu 
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de temps apres la fecondation (c'est-a-dire moins de 
24 heures) . De cette maniere, 1' insert ion est 
effective pendant que l'oeuf est a l'etat 
unicellulaire . 

5 L 1 invention concerne aussi un plasmide apte a 

effectuer l 1 insertion ciblee d'un gene recombinant 
dit gene d 1 insertion dans le genome d'une cellule 
eucaryote, caracterise en ce qu'il contient un 
inserat comprenant lui-meme le gene d' insertion et 

10 deux sequences dites "flanquantes" de part et d 1 autre 
du gene d 1 insertion, respectivement homologues aux 
deux sequences genomiques qui jouxtent le site 
d 1 insertion souhaite dans le gene receveur, 

L 1 invention concerne egalement des animaux 

15 transgeniques dans lesquels au moins un gene endogene 
a ete inactive par 1' insertion d'un gene qui est 
different du gene inactive, le gene d 1 insertion etant 
insere dans une position qui permet 1' expression de 
ce gene sous le controle des sequences regulatrices 

20 du gene endogene inactive, 

Le procede de I 1 invention permet, done, grace au 
phenomene de recombinaison homologue, d'inserer d'une 
maniere ciblee des genes etrangers , en particulier 
des sequences codantes depourvues du promoteur qui 

25 leur est normalement associe, dans le genome d'un 
organisme eucaryote a un site qui permet leur 
expression sous le controle du promoteur endogene du 
gene ou se fait 1' insertion/ et par consequence, 
d'inactiver le gene endogene cibl6. 

30 Selon un mode de realisation prefer^ de 

1' invention, le gene receveur cible est un gene qui 
est present dans le gdnome en au moins deux 
exemplaires. L' utilisation de la technique 
d f 61ectroporation (Ref. 11) assure 1 ■ introduction 

35 d'une copie seulement du gene stranger. 
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Selon cette variante de l 1 invention, l 1 insertion 
ciblee du gene d'intdret (c 'est-a-dire le gene dit 
d' insertion) a pour effet d'inactiver la seule copie 
du gene cellulaire endogene oil se fait l r insertion et 
5 laisse intacte et fonctionnelle la ou les autre (s) 
copie (s) de ce gene. 

De cette fa?on, le fonctionnement genetique de 
l 1 animal transg6nique n'est pas ou peu perturbe par 
1 1 introduction du gene etranger, meme si I 1 insertion 

10 inactive une seule copie d'un gene essentiel receveur 
pour le developpement de 1' animal. Soit son 
developpement ne serait done pas affecte par 
1* insertion du gene etranger, soit les perturbations 
mineures possibles dans le cas de 1 1 inactivation d'un 

15 gene critique ne seraient probablement pas lethales 
pour l 1 animal. Les effets de 1' insertion du gene 
etranger a l'etat homozygote pourraient etre de toute 
nature et seraient observes en 2eme generation (F2) 
apres croisements d'individus heterozygotes (Fl) 

20 entre eux. 

Si, par contre, 1 ' inactivation de toutes les 
copies d'un gene est souhaitee, par exemple, dans le 
cas ou le gene code pour un recepteur d f agent 
infectieux, de multiple copies du gene etranger sont 
25 introduites. Le controle de la quantite introduite 
peut etre assure en faisant appel a des techniques 
connues . 

L 1 insertion ciblee du gene stranger perraet done 
son introduction dans un site ou son expression est 
30 sous le controle des sequences r^gulatrices du gene 
endogene ou se fait 1' insertion. 

Le proced6 de 1« invention permet ainsi d'inserer 
le gene dtranger derrifere un promoteur endogfene qui a 
les fonctions desirees (par exemple, specif icite 
35 d'expression dans tel ou tel tissu) , et cela, le cas 
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echeant, sans inactiver les autres copies du gene 
receveur . 

Selon un mode de realisation particulierement prefere 
de 1' invention, l'ADN d' insertion comporte entre les 
5 sequences flanquantes, d'une part une sequence d'ADN 
destinee a etre recombinee avec l'ADN de complement 
dan.s le gene receveur pour fournir un gene 
recombinant, et, d' autre part, une sequence codant 
pour un agent selectif permettant la selection des 
transfonnants et un promoteur autorisant 1' express ion 
de 1' agent selectif, le gene receveur et le gene 
recombinant codant pour des produits d' expression ne 
conferant pas de phenotype selectable. 

De cette maniere, la selection des trans formants 
est entierement independante de la nature du gene 
receveur et du gene insere, contrairement aux 
procedes decrits jusqu'a ce jour dans lesquels le 
gene insere ou le gene receveur devait par necessite 
coder pour un produit d' expression permettant la 
selection des trans formants. Le systeme developpe par 
les inventeurs permet une flexibility totale en ce 
qui conceme la nature du gene receveur et du gene 
insere ou du gene forme par la recombinaison 
homologue. Les inventeurs ont constate d'une maniere 
25 surprenante que 1' insertion de sequences de taille 
importante (par exemple d' environ 7.5 kb) n'affecte 
pas la frequence de recombinaison homologue. 
L'effet que peut avoir 1' insertion de la sequence 
d'ADN selon cet aspect de 1' invention inclut, selon 
30 le type de sequence inseree par exemple le 
remplacement d'une sequence codante, le remplacement 
d'une sequence regulatrice, 1 ' inactivation ou la 
reactivation d'un gene par mutation ou 1 ' amelioration 
du taux d'expression d'un gene. II est possible, 
35 selon 1' invention, de remplacer une phase codante ou 
une partie d'une phase codante par une sequence 
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heterology qui commence au codon d- initiation du 
gene remplace afin que 1' expression du gene insere 
remplace entierement 1- expression du gene remplace. 
ceci evite la formation de proteines de fusion qui 
5 pourrait etre indesirable chez un animal 
transgenique. 

Selon ce mode de realisation de 1' invention, 
l'ADN d' insertion peut coaporter entre les sequences 
flanguantes une sequence codante heterologue 

10 depourvue de promoteur, la sequence codante etant 
autre qu'un gene codant pour un agent de selection. 
L'ADN d' insertion peut comporter en outre, en aval de 
la sequence codante et tou jours entre les sequences 
flanguantes, un gene codant pour un agent de 

15 selection, associe a un promoteur permettant son 
expression dans la cellule cible. 

De cette maniere, la sequence codante heterologue 
peut etre inseree derriere un promoteur endogene qui 
a les propriety souhaitees, par exemple une certaine 
° specificite d' expression, ou grille de transcription 
etc, la selectabilite des cellules transformees etant 
entierement independante de 1' expression de la 
sequence codante heterologue. Ce type de construction 
permet, par exemple, de selectionner les 
transformants meme si le gene remplace par la 
sequence codante heterologue n'est pas normalement 
exprime dans les cellules cibles. ceci est 
particulierement important dans la production 
d'animaux transgeniques a partir de cellule e S 
("Embryonic stem Cells") puisqu'une proportion 
importante des genes reste inactive jusqu'a un stade 
plus avance du developpement de 1' animal. Le gene 
Hox-3.1 est un exemple de ce type de gene. D'autre 
part, si la sequence codante code pour une protdine 
facilement decelable, par exemple, le b-Gal, le 
development de la grille de transcription du gene 
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endogene remplac6 peut etre suivi. Le vecteur pGN est 
un exemple de ce type de construction, 

Selon un autre mode de realisation de 
1' invention, l'ADN d' insertion peut comporter une 
5 sequence regulatrice etrangere. Le site d' insertion 
et f par consequence, les sequences flanquantes sont 
choisies en fonction du but desire, a savoir soit 
l f insertion de la sequence regulatrice dtrangere pour 
donner un effet de "double promoteur" avec la 
10 sequence regulatrice endogene, ou soit le 
replacement d'un promoteur endogene par le promoteur 
etranger. La sequence codante qui se trouve sous le 
controle de la sequence regulatrice peut etre 
endogene. 

15 une autre possibility serait l 1 insertion ciblee 

d'un ADN etranger qui comporte a la fois une sequence 
regulatrice et une sequence codante. II est possible 
que la sequence regulatrice . soit celle qui est 
naturellement associee avec la sequence codante. 

20 Le procede de l 1 invention met en oeuvre un 

vecteur contenant deux sequences "flanquantes" de 
part et d 1 autre du gene etranger. Ces sequences 
flanquantes ont au moins 150 paires de bases et sont 
de preference inferieures a la longueur du gene 

25 receveur. II est essentiel que ces deux sequences 
flanquantes soient homologues aux deux sequences 
genomiques qui jouxtent le site d' insertion souhaite. 
La sequence flanquante du vecteur qui se trouve en 
amont du gene etranger 4 introduire, est normalement 

30 homologue a la sequence gdnomique qui est situee du 
cote 5 1 du site d 1 insertion. De la meme maniere, la 
sequence flanquante du vecteur qui se trouve en aval 
du gene etranger, est normalement homologue a la 
sequence genomique qui est situde au cote 3 1 du site 

35 d 1 insertion. 
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II est possible d 1 introduire des sequences 
"intercal antes" entre l'une ou 1' autre des sequences 
flanquantes et le gene etranger, par exemple des 
sequences permettant la selection des transformants, 
des marqueurs, des sequences pennettant le clonage du 
vecteur, etc... 

La position de ces sequences intercalantes vis- 
a-vis du gene etranger doit pourtant etre choisie 
afin de ne pas empecher 1' expression du gene 
etranger, en particulier de la sequence d'ADN codante 
etrangere sous le controle du promoteur endogene ou, 
a 1' inverse, la sequence codante d'ADN endogene sous 
le controle d' elements de regulation etrangers 
apportes par la sequence d' insertion. 

Malgre la presence des sequences flanquantes, 
qui encourage une recombinaison homologue, il est 
possible qu'un certain nombre d » integrations se fasse 
au hasard. Afin de verifier que 1' insertion ciblee a 
bien eu lieu dans le site cible et non pas dans un 
autre endroit, la technique du -Polymerase Chain 
Reaction" (P.c.R.) (voir Ref. 10) est utilisee pour 
amplifier la sequence d'ADN du locus ou 1' insertion 
aurait da se faire. De cette facon, seuls les clones 
transforms a la suite d'une recombinaison homologue 
25 sont selectionnes. 

Les sequences flanquantes du vecteur sont bien 

evidemment choisies en fonction du site d' insertion 

desire pour que la recombinaison homologue puisse 

avoir lieu. Le cas echeant, les sequences flanquantes 

peuvent comporter des sequences repliques du 

promoteur endogene et/ou des modifications aux 

sequences qui precedent le codon d' initiation pour 

ameliorer le taux de traduction (sequences amont) et 

sequences repliques des sequences de terminaison 

notamment des sites de polyadenylation (sequences 
aval) . 
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Le gene d' insertion peut etre n'importe quel 
gene d ! int<§ret. On citera comme exemples non- 
limitatifs, le gene lac.Z (comme dans le modele 
decrit plus loin), les genes codant pour 
5 I'interleukine ou 1< interferon, les genes de 
r^cepteur, par exemple de I'acide retinoique ou 
beta-3 adrenergique ou de H.I.V., et des genes connus 
comme etant lies a certaines maladies, par exemple la 
myopathie , etc • • . 

Selon une variante preferee de 1' invention, les 
cellules eucaryotes sont des cellules souches 
embryonnaires (voir Ref . 14 et 15) . 

En effet, une cellule E.S. mutee peut etre 
injectee dans un embryon precoce qui, apres 
reimplantation, pourra naitre sous une forme chimere. 
Si la lign£e germinale est colonisee par la cellule 
mutee, 1' animal chimere transmettra la mutation a sa 
descendance. Par la suite, on pourra observer les 
effets de cette mutation, a l'etat homozygote chez 
certains individus, sur leur d6veloppement, leur 
comportement, leur metabolisme, leur pathologie, 
etc. . 

La figure 1 montre le plasmide pGN, 
Les figures 2 a et b montrent les molecules pGMA 
25 et pGMD respect ivement construites a partir du 
plasmide pGN par rapport au gene Hox-3.1. Ces 
plasmides sont des plasmides de mutagenese. Les deux 
parties de la phase codante du gfene Hox-3.1 sont 
representees, sur le chromosome 15, avec la boite 
30 "homeo" en noir. Les sequences correspondantes de 
Hox-3.1 ont 6te clondes dans le plasmide pGN. 
(A : signal de polyadenylation; Enh/Pro : enhancer- 
promoteur) . 

07 et 08 figurent les deux oligonucleotides utilises 
35 dans la PCR. 
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Les figures 3 a 6 montrent les plasmides 
utilises dans la construction du pGN. 

La figure 7 illustre la detection de 
recombinaison homologue avec la technique Reaction de 
5 Polymerase en Chaine (P.c.R.) sur des cellules E.S. 
transf ectees . 

La figure 8 (a) et (b) montre des analyses de 
Southern de clones individus positifs (L5 et F2) et 
cellules E.S. (C.C.E.) . 

10 Le precede de !■ invention est d ■ application 

mdustrielle tres large et peut varier selon la 
nature du gene etranger introduit. 

La genetique des mammiferes va progresser de 
maniere considerable grace a la possibilite recente 
15 de mutageneiser specif iquement n'importe quel gene 
permettant ainsi de mieux definir son role. Par cette 
technologie qui fait intervenir recombinaisons 
homologies et cellules E.S., des informations 
precieuses seront apportees SU r des oncogenes, des 
20 facteurs de croissance, des facteurs de 
transcription, etc., genes qui concernent des 
sirjets tres actuels de la recherche fondamentale ou 
la recherche appliquee. Un debouche important pour la 
recherche medicale est la possibilite de reproduire 
une maladie humaine dont la determination genetique 
est connue (certaines maladies humaines a 

pathologie, telle la myopathie de Duchesne) ceci afin 
de mieux en etudier les micanismes et de rechercher 
une therapeutique. 

En applicant le precede de 1« invention, un gene 
connu comme etant responsable d'une certaine maladie 
est insere d'une maniere ciblee dans le genome d'une 
cellule E.s. L'aniaal transgenique qui est produit a 
la suite presente un modele utile de cette maladie. 

Si necessaire, et comme decrit plus haut, les 
fonctionnements genetiques normaux peuvent etre 
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sensiblement maintenus, malgri 1' insertion du gene 
etr anger. 

Une autre application du procede de I 1 invention 
consiste a insurer un gene d' insertion qui est 
5 facilement decele e.g. le gene lac. 2 et qui peut done 
jouer le role d'un marqueur cellulaire. De cette 
maniere, des etudes de filiation e.g. chez des 
animaux de concours sont facilities, et la race peut 
etre suivie. 

10 L 1 insertion du gene lac.Z comme gene d' insertion 

rend aussi possible des etudes de promoteur. Grace a 
la possibility de deceler l'activite 0-galactosidase, 
l'activite et la specif icite de differents promoteurs 
endogenes peuvent etre dtudi6es en ciblant differents 
15 sites dans le meme type ou differents types de 
cellules . Les memes dtudes pourront etre ef f ectuees 
sur un organisme entier, au cours du developpement ou 
a l'etat adulte f en utilisant les techniques 
d 1 animaux chimeres ou transg6niques. 

20 Les inventeurs ont constate d'une maniere 

surprenante que la frequence de recombinaison 
homologue n'est pas affectee par 1» insertion de 
fragments de taille importante, par exemple le Lac Z. 
Cette observation a suggire aux inventeurs que la 

25 technique de recombinaison homologue serait bien 
adaptee a 1' insertion d'autres genes heterologues qui 
sont da taille importante. 

Grace a la possibility de modifier le genome 
d'un animal, le procede de 1" invention peut egalement 

30 etre utilisee en tant que "th6rapie genique". Les 
utilisations les plus evidentes consisterait a 
inactiver les genes de recepteurs d' agents infectieux 
(virus ou bact6ries) ou toxiques. Si cette mutagenese 
s'avdrait 16thale, il faudrait retablir la fonction 

35 perdue sans ritablir la sensibilite aux agents 
nuisibles. Un g&ne modifi6 codant pour un tel 
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recepteur pourrait etre reintroduit dans la cellule 
mutee, a moins que la modification puisse etre 
provoguee par la recombinaison homologue. Cette 
modification du patrimoine g^netique confererait a 
l 1 animal une immunite contre la maladie consideree. 

Ce protocole peut aussi intervenir dans le cadre 
d'auto-greffe. Des cellules, malades ou saines, 
prelevees sur un patient, pourraient etre soignees et 
immunisees, puis reimplantees chez le meme individu. 

La technique de 1 1 invention se prete aussi aux 
etudes d' activite de produits pharmaceutiques 
presumes avoir une activite h l'^gard des produits 
d f expression d'un gene pathologique lie a une 
maladie. Dans ce cas, le gene d 1 insertion est 
constitue par le gene pathologique et on administre a 
1* animal transgenique le produit pharmaceutique en 
vue d'evaluer son activite sur la maladie. 

L 1 invention va etre illustree en faisant 
reference au plasmide pGN et son utilisation dans 
l 1 insertion ciblee d'un gene stranger (lac. Z, codant 
pour 1 'enzyme 0-glactosidase d'E.Coli) dans le genome 
d'une cellule d'E.S. de souris. Le gene lac.Z a ete 
choisi en raison du fait que son expression peut etre 
facilement decelee et est simplement a titre 
illustratif • 

La phase codante de 1 1 enzyme 0-galactosidase 
d'E.Coli (lac. 2; 1-3057), fusionnee avec une sequence 
genomique (7292-3) du gene murin Hox.3-1 (Ref. 1), 
debute par le codon d' initiation de ce gene. En 
effet, la sequence qui precede le codon d 1 initiation 
de Hox-3.1 est identique a la sequence consensus 
observee chez les vert6bres (Ref. 2), permettant 
ainsi un meilleur taux de traduction de la 
galactosidase dans les cellules de vertebres. Le gene 
lac.Z est suivi d'un signal de polyadenylation par 
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exemple du virus SV 40, comme la plupart des genes 
eucaryotes, afin de stabiliser les ARN S messagers. 

L'activite de la £-galactosidase d'E.Coli, qui 
est fonctionnelle dans les cellules eucaryotes, peut 
etre decelee de differentes manieres. pes cellules 
exprimant le gene lac.Z prennent une coloration 
bleue, apres fixation, en presence de X-Gal, qui est 
un substrat de la 0-galactosidase (Ref. 3), Un 
nouveau substrat, le FDG (flurorosceine di-0- 
galactopyranoside) , pennet de ddceler et de doser 
l'activite 0-gal. tout en gardant les cellules 
vivantes (Ref. 4). Les cellules exprimant lac»Z 
accumulent un produit fluorescent et peuvent etre 
isolees a I'aide d'un trieur de cellule ou FACS 



(fluorescence-activated cell sorter) . 

L 1 unite de transcription du gene de resistance a 
la neomycine provient, en grande partie, du plasmide 
pRSV neo (Ref. 5) . Le LTR (long terminal repeat) du 
virus du sarcome de Rous procure des sequences 
activatrice et promotrice tres puissantes dans de 
nombreuses cellules eucaryotes (Ref. 6). Du 
transposon bactdrien Tn5, viennent un promoteur actif 
dans E.Coli et la phase codante de 1" enzyme 
phosphotransferase (Ref ♦ 7) , qui est suivie du signal 
de polyadenylation du virus SV40. Le meme gene sous 
le double controle des promoteurs RSV et Tn5 peut 
conf^rer la resistance a la neomycine ou la 
kanamycine aux bacteries et la resistance au G418 aux 
cellules eucaryotes. 

Par l'effet d'une simple mutation ponctuelle, 
1' unite B des sequences activatrices (enhancer) de la 
souche PyEC F9.1 du virus du Polyome est devenue 
beaucoup plus active dans differents types de 
cellules, et en particulier dans les cellules de 
carcinome embryonnaire (EC) (Ref, 8) . Deux copies de 
cet enhancer Py F9.1 ont 6t6 inser£es en tandem dans 
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le plasmide pGN, en amont du LTR-RSV, et dans 
l 1 orientation "promoteur tardif" de la region 
regulatrice du Polyome. 

Afin d'ameliorer le taux de traduction de la 
5 phosphotransferase, la sequence precedent le codon 
d' initiation a 6te modifiee lors d'une mutagenese par 
oligonucleotide. Ainsi la sequence TTCGCAUG 
est devenue G c A C C AUG, correspondant beaucoup 
mieux a la sequence consensus d' initiation de la 
10 traduction chez les vertebres (Ref. 2). 

Les ameliorations apportees a 1' unite de 
transcription du gene de resistance a la neomycine 
ont pu etre estimees en transfectant des cellules 
souches embryonnaires (ES) de souris. A molarite 
15 egale en plasmide, une construction avec les enhancer 
Py F9.1 a produit 7,5x plus de clones resistants au 
G418 que le pRSV neo et 2 a 3x plus que le pMCl Neo 
decrit par Capecchi et al (ref. 13). A nouveau f le 
nombre de clones a ete augments 60x, soit 450x par 
rapport au pRSV neo, en modifiant la sequence 
d' initiation de la traduction. La recombinaison 
homologue peut £tre un evenement assez rare, selon 
les conditions experimentales appliquees (p. ex 
1/1000 pour HPRT, ref. 13). Un vecteur presentant une 
25 efficacite de selection elevee est done tres utile, 
d'autant plus que les conditions d 1 electroporation 
donnent lieu principalement a 1 ' integration d'une 
seule copie. 

Le plasmide pGN contient, en outre, une origine 
30 de replication bacterienne de type colEl, pBR322, qui 
permet les clonages et les preparations dans E.Coli. 

Enfin, un site de clonage multiple (M.C.S.), 
synthetis6 in vitro, qui ne contient que des sites de 
coupure uniques dans pGN, a <St6 insure en amont de 
35 lac.Z, afin de faciliter les utilisations de ce 
plasmide. 
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Les sequences "flanquantes" plasmidigues qui 
provoquent la recombinaison homologue sont ajoutees 
aux extremities du plasmide pGN apres linearisation du 
plasmide en amont de lac.Z, par un site du MCS (voir 
5 fig. 2). En 1' occurence, les sequences flanquantes 
choisies sont homologues des sequences chromosomates 
issues de Hox-3.1 devant ult£rieurement intervenir 
dans la recombinaison homologue. 

La figure 2 situe la molecule construite a 

10 partir du plasmide pGN par rapport au gene Hox-3.1. 
Dans ce cas, une recombinaison entre les sequences 
plasmidiques et chromosomales de Hox-3.1 resulterait 
en une insertion au debut de la phase codante de ce 
gene, done a son inactivation totale. 

15 Le plasmide pGN rassemble plusieurs avantages 

pour cette methodologie, qui est applicable a 
n'importe quel gene. L'evenement de recombinaison 
homologue pouvant etre assez rare (de l'ordre de 1 
pour 1000 integrations non-homologues) , il est 

20 necessaire de pouvoir analyser un grand nombre de 
clones dont la resistance au G418 soit suffisament 
forte pour s'exprimer dans n'importe quelle partie du 
genome. Les modifications apportees a 1' unite de 
transcription de la phosphotransferase repondent 

25 parfaitement a ces problemes. La methode de 
mutagenese par recombinaison homologue equivaut h 
inactiver un gene par une insertion ou une 
substitution, mais le plasmide pGN presente 
l'avantage suppl6mentaire de pouvoir substituer 

30 1< expression de la 0-galactosidase a celle du gene 
mut£. Enfin, le MCS facilite les clonages de 
fragments genomiques. 
EXEMPLES : 

I - Construction du plasmide pGN 
35 Les plasmides intermediates sont numdrotes 

selon leur etape. 
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1 0 etape : 

Insertion d'un site Xho I dans le site Bal I dg 
pRSV neo 

Insertion d'un linker Xho I dans le site Bgl I de 
5 pRSV neo, rempli par le fragment Klenow de l'ADN 
polymerase d'E.Coli. 
2* etape : 

Insertio n d'un site Cla I dans le site Nde I du 
plasmide pi 

10 Insertion d'un linker Cla I dans le site Nde I de pi, 
rempli par la polymerase Klenow. 
3° etape : 

Insertion d' enhancer Pv F9.1 dans le site Cla I 
du plasmide p2 

15 Insertion d' enhancer Py F9.1 Pvu Il-Pvu II isole par 
un site unique, Acc I, dans le site Cla I de p2. 
Selection d'un clone contenant deux enhancers oriente 
dans le sens "promoteur tardif". 
4 * etape : 

20 Deletion Sma I-Hpa I du Plasmide p3 

Les deux enzymes, donnant des extremites "bouts- 
francs", peuvent etre liguSs directement. Cette 
deletion enleve 1'intron de l'antigene t de sv 40, 
qui n'est pas tres utile, et diminue de maniere 

25 appreciable la taille de 1 'unite de transcription de 
la phosphotransferase. 
5* £tape : 

Insertion d'un site Xho I dans le site Bam HI de 
PCH110 

30 Insertion d'un linker Xho I dans le site Bam HI du 
plasmide pCH 110 (Pharmacia), rempli par la 
polymerase Klenow. 
6* etape : 

Insertion du 3' lac.Z-polyA SV 40 dans le 
35 plasmide p4 
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La partie 3' de la phase codante de la 
galactosidase, suivie du signal de polyadenylation du 
virus SV 40 est isolee du plasmide p5 par les sites 
Xho I-Aat II et clonee dans le plasmide p4 par les 
memes sites* 
5 7 * etape : 

Insertion du 5 f lac.Z dans le vecteur KS- 
La partie 5 1 de la phase codante de la 
galactosidase est isolee du plasmide pMC 1871 
(Pharmacia) par les sites Pst I-Sac I et clonee dans 
le vecteur KS- (Stratagene) par les memes sites. 
8 ' 6tape : 

Fusion d'une sequence qenomicrue Hox-3.1 avec le 
5 1 lac.Z 
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Une sequence genomique du gene Hox-3.1, clonee dans 
le vecteur KS-, est purifiee par digestions 
successives par l 1 enzyme Sac I, puis par la nuclease 
Mung bean et enfin par l 1 enzyme Apa I. Cet insert est 
fusionne avec la partie 5 1 de la phase codante de la 
^-galactosidase par clonage dans le plasmide p7 
digere par Apa I-Sma I, La proteine ainsi fusionnee 
contient le codon d f initiation de la traduction du 
gene Hox-3.1 suivi de la phase codante de la 0- 
galactosidase (verif iee ensuite par sequengage) • 
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30 



Met Ser Set Da Pro Gly Asp Pro 

CCAGC ATG AGC TCC ATT CCC fVftq GAT CCC 

GGTCG TAC TQG AGG TAA GGG CCC CTA GGG 

iSacI 

CCAGC ATG AGC T (Srnal 
GGTCG TAC 

i nuclease Mung bean 
CCAGC ATG GGG GATCCC 

GGTCG TAC o CCC CTG GGG.. 

Met Gly Asp Pro 
35 CCAGC ATG GGG GAT CCC 

GGTCG TAC CCQ CTA GGG 
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9° etape : 

Insertion de Hox-3.1-5 1 lac, 2 dans le plasmide 

£6 

La fusion Hox-3.1-5 1 lac. 2 est isolee du plasmide p8 
5 par les sites Apa I-Sac I et clonee dans le plasmide 
p6 par les memes sites. Ce clonage a pour effet de 
reconstituer la phase codante de la 0-galactosidase 
dans sa totalite. 
10* etape : 

10 Insertion du gene Neo R dans le vecteur KS+ 

Le gene de resistance a la neomycine (promoteur 
bacterien et phase codante de la phosphotransferase) 
est isolee du pRSV neo par les sites Hind III-Eco RI 
et clonee dans le vecteur KS+ (Stratagene) . 

15 11* etape : 

Mutaqenese de la sequence d' initiation de Neo R 
dans plO 

La sequence d 1 initiation de la traduction de la 
phosphotransferase est modifiee pour etre identique 

20 a la sequence consensus observee chez les vertebres 
et pennettre ainsi un taux superieur d 1 initiation de 
la traduction done une resistance accrue au G418 pour 
les cellules de mammiferes. La modification cree 
egalement un site Apa LI qui permet de controler 

25 l'efficacite de la mutagenese. 



30 




GTTTCGCAJJi GTGCACCATG 



Un oligonucleotide 
( CTTGTTCAATCATGGTGCACGATCCTCA) comportant une region 
de misappariement avec la sequence du pRSV neo 
(soulignfie) est synthetisd (Gene Assembler, 
35 Pharmacia) puis phosphorylee par la polynucleotide 
kinase du bacteriophage T4. Une matrice simple brin 
du plasmide plO est preparee gr&ce a l'origine fl du 
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plasmide KS+ et hybridee avec 1' oligonucleotide de 
mutag^nese. Le deuxieme brin est synthetise et repare 
par la polymerase Klenow et 1'ADN ligase du 
bacteriophage T4. Apres transformation de bacteries, 
les clones mutes sont criblds & l'aide de 
5 1 1 oligonucleotide marqu6 au ^P. La mutagdnese a et6 
verifi£e en digerant par Apa LI ainsi que par 
sequen^age. 
12' etape : 

Remplacement de la sequence d 1 initiation dans le 
plasmide p9 

Un fragment contenant la sequence modifiee 
d 1 initiation de la traduction du gene de resistance a 
la neomycine est isolee du plasmide pll par les 
enzymes Hind III-Eag I et clonee dans le plasmide p9 
par les memes sites. 
13* £tape : 

Insertion du site de clonage multiple dans le 
plasmide p!2 

Deux oligonucleotides complementaires sont 
synthetises (Gene Assembler, Pharmacia) puis 
phosphoryles . Apres appariement, le MCS est clone 
dans les sites Apa I- Sac II du plasmide p!2 grace k 
ses extremites cohesives 
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Xmat Asp 718 

Aral SmaJ KnoJ *bat m*h sac n 

5* CC C CGGGGGTACCTCTAGAATGC ATTCCQC 9 
S CCGGGGGGCCCCCATGGAGATCTTACGTAAGG S> 




30 Le site de clonage multiple a egalement 6te verifie 
par sequen£age. 

II - Addition des sequences "flanquantes" aux 
extremites du plasmide pGN linearise en amont de 
lac.Z 1 par un site du M.C.S 
35 Les sequences flanquantes utilisees ont ete 

choisies en fonction du site d 1 insertion souhaite 
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(par exemple, Hox-3.1, voir Fig. 2 a et b pGMA et 
pGMD) . 

Dans la construction du plasmide de mutagenese 
pGMD, deux bras d'ADN homologue au locus Hox-3.1 ont 
5 ete clones aux sites Apa I-Nsi I et Nsi i-sac II du 
vecteur pGN. Le bras 5' commence au site Sac II 
(CCGCGG)au nucleotide 219 de l'ADNc c21 de Hox-3.1. 
Ce fragment s'etend sur 6.8 kb en 5« jusqu'au premier 
site BamHI. Le bras 3' commence au site Apa 1 
(GGGCCC) au nucleotide 885 de l'ADNc c21. Ce fragment 
s'etend sur 1.5 kb en 3' jusgu'au premier site Pstl. 
Un linker Nsil a ete insere dans le site BamHI du 
fragment 5' et dans le site Pstl du fragment 3». Les 
bras 5' et 3' ont ete clones dans le vecteur pGN dans 
les sites Nsi I-Sac II et Apa I-Nsi I, 
respect ivement. La sequence de l'ADNc de Hox-3.1 C 2l 
est publiee (ref . 1) . 

Le plasmide de mutagenese est linearise par 
digestion avec Nsi I avant 61ectroporation de 
cellules E.S. Ses extremites sont formees des deux 
bras genomiques clones aux sites Apa I-Nsi I et Nsi 
I-Sac II du vecteur pGN. 

Le plasmide pGMD ne presente pas de signal de 
polyadenylation apres le gene de resistance mais, en 
25 revanche, presente une sequence riche en AU 
responsable d'une degradation selective de mRNA, 
inseree dans la sequence de l'intron du Hox-3.1 du 
plasmide. 

Un autre plasmide de mutagenese, pGMA, presente 
la mime structure que le pGMD mais contient les 
signaux de polyadenylation et de terminaison de 
transcription du SV40 et ne presente pas la sequence 
AU de degradation de mRNA en aval du gene Neo r . Ces 
modifications avaient pour but de reduire le taux de 
35 transcrits de Neo r dans des clones issus 
d » integration au hasard. En revanche, des clones 
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issus d 1 tenements de recombinaison homologue entre 
pGMD et un locus Hox-3.1 devrait avoir une croissance 
inalteree pendant la selection au G418, la sequence 
AT de degradation de mRNA etant elimin6e par le 
5 procede de recombinaison meme, ou epissee avec 
l f intron Hox-3.1. 

Dans les dtapes experimentales qui suivent, le 
protocole decrit par Thompson et al. 1989 , a 6t6 
suivi pour la production d'animaux chimeres. 
10 III - Transfection de cellules embryonnaires de 
souris 

La methode decrite par Thompson et al. 1989, a 
ete utilisee pour transfecter des cellules 
embryonnaires de souris. L 1 utilisation de la 
15 technique de 1 1 electroporation assure 1 1 introduction 
d'une seule copie du gene etranger (lac.Z) par 
cellule. Apres transfection, plusieurs clones 
exprimant la /?-galactosidase ont ete isoles. 

Les plasmides de mutagenese pGMD et pGMA ont ete 
20 linearises et introduits par electroporation dans des 
cellules E.S. afin de favoriser 1' insertion d'une 
copie seulement dans le genome (ref . 11) . 

Les transfections initiales ont ete effectuees 
pour comparer l'efficacite de ciblage du Hox-3.1 des 
25 plasmides pGMA et pGMD (voir tableau I) • 





Recombinaison homologue dans le gene Hox-3.1 




Exp. 


Plasmide 


N* de 


Nb de clones 


Nb de resul- 


30 




de muta- 


1 1 ensemble 


formant 


tats P.C.R. 






gdnese 


analyse 


1 1 ensemble 


positifs 




I 


pGMA 


3 


600 


0(2) 




II 


pGMD 


5 


250 


3(5) 




III 


pGMD 


84 


2-3 


5(5) 


35 













Tableau I 



WO 90/11354 



PCT/FR90/00185 



25 

La lignee cellulaire E.S. "C.c.E." (ref. 16) a 
ete maintenue d'une maniere continue sur des couches 
nourricieres f ibroblastiques (ref, 17) . Pour les 
experiences I et II, 1.5 x 10 7 cellules E.S. dans 1.5 
5 ml HeBS ont ete electroporees (ref. 11) a 200 V, avec 
40 mg de plasmide linearise, puis 6talees sur quatre 
boites de cultures (diametre 100 mm) . Pour 
1' experience III, le choc a 6te effectu6 dans les 
memes conditions mais un quart des cellules ont ete 

10 etalees sur quatre plaques h 24 puits. Le lendemain, 
250 fig ml" 1 G418 ont ete ajoutes. Chaque transfection 
a donne lieu a environ 2400 clones avec pGMA et 
environ 1000 clones avec pGMD. 

Le nombre moyen de clones de cellules E.S. 

15 resistantes au G418 dans chaque ensemble est indique 
dans le tableau I, ainsi que le nombre d 1 ensembles 
donnant un resultat positif avec la technique P.C.R. 
Un resultat positif signifie q'une bande de 1.6 Kb a 
pu etre observee sur un gel d 1 agarose colore de 

20 bromure d'ethidium (voir fig, 7). Le nombre 
d 1 ensembles donnant un signal positif apres une 
analyse de Southern du melange P.C.R. et hybridation 
d'une sonde specif ique qui ne contenait pas les 
sequences des amorces est indique entre parentheses 

25 (fig. 8). 

Detection de la recombinaison homolocrue avec la 
P.C.R. 

P.C.R. a ete effectuee sur 10 5 -cellules d'un ensemble 
de 250 clones de la transfection II (voir voie D de 

30 la fig. 7) . Dans les autres voies, quatre ensembles 
de la transfection III ont ete analyses ensemble en 
m£langeant environ 4 x 5000 cellules. Les amorces 07 
et 08 utilisees dans la P.C.R. entourent la sequence 
3' Hox-3.1 du plasmide de mutagdnese (fig. 2). Le 

35 fragment de 1.6 Kb recouvrant cette sequence 3 1 ne 
peut etre amplifie que dans le cas d'une 
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recombinaison homologue. Les voies 2, 3 et D 
illustrent des resultats positifs. 

L'ADN de clones E.S. a ete prepare au moment de 
la repligue sur filtre en utilisant la mdthode 
5 "boiling-proteinase K digestion boiling" (ref. 18), 
40 cycles d' amplification (40 secondes a 94 - C, 1 
minute a 60*C, 7 minutes a 72 # C) ont ete effectues 
dans un melange reactionnel de 100 /il, contenant 67 
mM Tris-HCL (pH 8.6), 16.7 mM (NH 4 ) 2 S0 4 , 6.7 mM MgCl 2 , 

10 io mM 2-mercaptoethanol, 0.01 % (p/v) gelatine, 200 
/iM dATP, dTTP et dCTP, 100 fM dGTP, 100 /xM 7-deaza 
dGT, 600 ng de chague amorce (07 : 
AACTTCCCTCTCTGCTATTC et 08 : CAG CAGAAACATACAAG CTG ) et 
3U polymerase Taq (Perkin Elmer Cetus) , couvert de 

15 100 pi paraffin. La moitie du melange de reaction a 
ete appliquee sur un gel d' agarose 0.7 % colore au 
bromure d'ethidium. Le marqueur de taille est un 
digest Eco RI + Hind III d'ADN lambda. 
Analyses de Southern 

20 Trois clones independants de cellules E.S. contenant 
le Hox-3.1 mut£ (identifie par P.C.R.) ont ete isoles 
des ensembles positifs .en utilisant des pipettes. 
Leur ADN a ete examine par analyse de Southern apres 
digestion avec les enzymes de restriction indigues 

25 dans la figure 8 f afin de conf inner le ciblage 
specifique et de faire la distinction entre les loci 
recombines et sauvages. Deux sondes differentes ont 
ete utilises dans l f analyse -de l 1 extremity 3* des 
loci Hox-3.1 dans les clones mutes et dans les 

30 cellules E.S. non-mutees agissant comme temoin (fig. 
8 c) . La premiere sonde "a" etait contenue dans les 
sequences Hox-3.1 du plasmide de mutagenese et 
demontrait le nombre d 1 integrations de vecteur et 
leurs liaisons physiques. Un des trois clones 

35 recombines contenait en outre une copie du plasmide 
integree au hasard (fig. 8 a, clone F2) . La deuxieme 
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sonde "b" qui n'£tait pas contenue dans le vecteur de 
mutagenese faisait la distinction entre les alleles 
Hox-3.1 recombinees et sauvages (fig. 8b). Le locus 
recombin6 Hox-3.1 presentait, avec les deux sondes, 
5 l" image d 1 hybridation attendue a partir des cartes de 
restriction du vecteur de mutagdn&se et du locus 
intact. En outre, I 1 existence de deux domaines de 
recombinaison dans le bras 3' du vecteur a 6te 
confirmee par la presence ou l 1 absence de la sequence 

10 AT dans le locus Hox-3.1 recombine (par exemple fig. 
8, clone L5) . L'extremite 5* du locus Hox-3.1 a 
egalement ete analysee pour 1 1 evenement de 
recombinaison homologue. Des enzymes de restriction * 
ne x presentant pas de sites dans la sequence Hox-3.1 

15 5 1 de 6.8 Kb du vecteur de mutagenese ont ete utlises 
dans la digestion des ADNs des clones recombines. Ces 
ADNs ont ensuite ete soumis a N une electrophorese dans 
un champ pulse pour differencier les fragments de 
poids moleculaire eleve. Une analyse de Southern de 

20 ce gel a egalement indique les alleles recombinees 
correctement et les alleles Hox-3.1 sauvages, * en 
utilisant une sonde presentant une sequence en amont 
du plasmide de mutagenese. 

Les analyses de Southern ont demontre q ! une 

25 allele du gene Hox-3.1 a ete recombinee comme prevu. 
La recombinaison homologue etait equivalente a un 
double "crossing-over" entre les bras genomiques du 
plasmide de mutagenese et les sequences chromosomales 
homologues (Fig. 2) . 

30 Dans les clones recombinants, le gene lac Z a 

6te place sous le controle des sequences promotrices 
et regulatrices du Hox-3.1 en amont du codon AUG, 
mais les signaux 3' de maturation de mRNA provenaient 
du SV40. Dans ces clones recombines, 1' expression de 

35 lac Z n 1 etait pas d6celable par coloration avec /?- 
Gal, ce qui est coherent avec l 1 absence de 
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transcription de Hox-3.1 dans des cellules E.S. 
determinee par analyse de protection de RNase. 
L'activite de /?-Gal pouvait etre induite dans 
certaines cellules apres 3 ou 4 jours de culture en 
5 presence de 5.10" 7 M acide rdtinolque, conditions 
connues comme induisant la transcription de Hox-3.1 
(r<*f. 19). 

En utilisant le vecteur de mutagenese pGMA, qui 
presente une homologie totale de 8-3 Kb ADN avec le 

10 locus Hox-3.1, un fragment de 120 pb a £te remplace 
par une insertion de 7.2 Kb. La frequence de ce 
remplacement cibl6 (1/900) est comparable a celle 
obtenue recemment (1/1000) avec HPRT (ref. 13) ou 
avec En-2 (1/260) (ref. 20) , le fragment heterologue 

15 insere etant cependant dans ces derniers cas d'une 
taille beaucoup moins importante (1.1 et 1.5 Kb 
respect ivement ) . D'une maniere surprenante, il a ete 
constate qu'une frequence de recombinaison homologue 
tres elevee (1/40) a pu etre obtenue avec le vecteur 

20 pGMD. L 1 elimination des signaux 3' de maturation de 
mRNA et l 1 addition de la sequence de degradation de 
mRNA au gene de resistance a la neomycine a eu pour 
effet de reduire le nombre total de clones resistants 
au G418 par 2.4 (tableau I). Le rapport de ciblage 

25 specifique etait presque 10 fois plus elevd (900/40) . 
Le mecanisme de recombinaison homologue meme a du 
dtre affectd dans les experiences avec pGMD. Une 
explication possible de ces r6sultats serait qu'une 
sequence AT de 51 pb pourrait fournir, in vivo , une 

30 boucle ouverte dans le plasmide de mutagenese a cause 
de sa temperature de fusion plus basse. Si les 
sequences Hox-3.1 voisines du pGMD peuvent etre 
influencees par cette ouverture, de chaque cote de la 
region AT, elles pourraient r6agir d'une maniere plus 

35 efficace, a l'dtat simple-brin, avec le locus 
chromosomal Hox-3.1. Le modele de recombinaison 
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mitotique chez la levure suggere qu'il serait initie 
par un tel echange de brins, bien que le mecanisme de 
recombinaison homologue reste inconnu chez les 
eukaryotes plus complexes. 

La figure 8 montre les resultats de 1' analyse de 
Southern effectuee sur des clones individus positifs 
(L5 et F2) et des cellules E.S. (C.C.E.). 

Les sondes utilisees n»hybrident qu'avec des 
sequences Hox-3.1 incluses dans le vecteur (a) ou 
exclues du vecteur de mutagenese (b) . L 1 image 
d' hybridation du locus Hox-3.1 recombine (triangles 
ouverts) se distingue clairement du locus sauvage 
(triangles noirs) . Les etoiles indiquent les bandes 
d 1 hybridation d'une copie du plasmide qui s'est 
integree au hasard. Le marqueur de taille est un 
digest Eco RI + Hind III d'ADN lambda. 

La figure 8(c) montre les cartes de restriction 
des alleles Hox-3.1 recombinees (rec.) et sauvages 
(wt) . Les parties du vecteur de mutagenese et du 
locus Hox-3.1 sont indiquees avec les memes symboles 
que ceux utilises dans la figure 2. Dans ce cas, la 
sequence AT a ete integree par recombinaison 
homologue. La fleche verticale indique l'extremite 3' 
du plasmide de mutagenese. La localisation des sondes 
"a" et "b" utilisees dans 1' analyse de Southern est 
egalement indiquee. Les abreviations utilisees dans 
la figure 8 sont les suivantes : B, Bam HI ; D, Dra 
I, E, Eco RI ; H, Hind III ; S, Sal I ; X, Xho I. 
IV - Production d'embryons chimeres 

Une microinjection dans des blastocystes a ete 
effectuee avec deux clones E.S. recombinants 
contenant un allele Hox-3.1 intacte et un allele 
recombind, ces clones ne contenaient aucune autre 
copie du plasmide de mutagenese. Les Kariotypes de 
ces cellules itaient normaux. 



FEIULIE BE REMPLACEiVSENT 



WO 90/11354 



PCI7FR90/00185 



30 

Dix a quinze cellules mutees ont ete 
microinjectees par blastocyste. Apres reimplantation 
dans des meres porteuses, les embryons ont ete 
recueillis a 9.5, 10.5 et 12.5 jours p.c. et analyses 
5 pour expression de lac Z. La grille de transcription 
de Hox-3.1 a ces stades avait 6t6 d6terminee au 
prealable par analyse d 1 hybridation in situ (r6f. 1) . 
Les transcrits Hox-3.1 sont detectables pour la 
premiere fois au stade de gastrulation tardive et 

10 sont repartis dans tous les tissus de la partie 
arriere de l 1 animal. Plus tard, la repartition 
devient progress ivement limitee dans l'espace et 
specifique au tissu. Au stade de 12.5 jours p.c, la 
transcription est localisee dans la region cervicale 

15 du tube neural, au niveau du coeur. Au cours de 
l'embryogenese, la repartition de la transcription de 
Hox-3.1 subit done des modifications. Le stade 10.5 
jours p.c. semble etre une periode de transition, la 
transcription ayant lieu a la fois dans les deux 

20 regions arrieres et dans le tube neural cervical. 

Dans des embryons chimeriques de 9.5 et 10.5 
jours p.c, la partie caudale au bourgeon posterieur 
presentait une activite ^-Gal intense, tandis que le 
margueur n'a jamais dte detecte dans la region 

25 thoracigue anterieure ou la tete (Fig. 9a) . Dans la 
region arriere, des cellules colorees par le ^-Gal 
ont ete observees dans tous les tissus et de toutes 
les couches embryonnaires. Entre les deux bourgeons 
qui donnent les membres, des cellules colorees 

30 etaient reparties dans des zones restreintes, dans 
l'ectoderme superficiel (Fig. 9b), comme dans les 
regions arrieres (Fig. 9c) et, en forme de lignes 
dtroites ou rayures, dans le tube neural (Fig. 9b). 
Ces rayures pr6sentaient une repartition irreguliere 

35 et asymdtrique sur la paroi du tube neural. La 
transcription de Hox-3.1 n'a pas 6te detectee dans la 
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couche mince de cellules vers la fermeture du tube 
neural, Ces cellules n'ont peut-etre pas rdsiste aux 
traitements appliques lors de 1 ■ hybridation in situ , 
II a dte observe que les cellules de l'ectoderae 
5 neurale font partie, tres tot, de parties differentes 
du systeme nerveux et migrent dans une direction 
radiale, suivant des mouvements lateraux dtroits 
(r£f . 21) . Ces resultats sont done coherents avec 
cette observation. 

L« expression de Lac 2 a done illustre 
correctement la premiere partie de la transcription 
de l'homeogene Hox-3.1 , c«est-a-dire dans tous les 
tissus des regions caudales des embryons de 9.5 et 
10.5 jours p.c, et a fourni de nouvelles 
informations concernant le mode de transcription de 
Hox-3.1. 

En revanche, 1' expression de Lac Z n'a pas ete 
observee dans les regions cervicales du tube neural 
d' embryons chimeres de 12.5 jours, ni dans la region 
antdrieure d< embryons de 10.5 jours ; ceci n'etait 
pas le resultat attendu a partir des etudes 
d» hybridation in situ . La phase ulterieure de 
transcription de Hox-3.1 observee a partir du jour 
10.5 dans les zones tres localisees du tube neural 
25 n'etait pas mise en evidence par l»activite de^-Gal. 
Une explication possible pour ce resultat serait que f 
bien que 1' expression de Lac Z soit sous le controle 
du promoteur Hox-3.1 , les sequences 3' du Hox-3.1 
sont absentes dans le gene reporteur. II est possible 
que des sequences 3* du codon d' initiation AUG du 
Hox-3.1 aient une influence sur 1" expression tardive 
de Hox-3.1 dans le domaine antSrieur. Un effet de 
"dosage de gene" pourrait aussi expliquer ce 
resultat. L'autoactivation de plusieurs homeogenes 
35 chez Drosophila a 6te d£montree genetiquement ou 
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suggeree par la formation de complexes entre l'ADN et 
les proteines des homeobox. 

Si le composant tardif de la transcription de 
Hox-3.1 dans le tube neural est maintenu par un 
5 m^canisme semblable, 1 1 inactivation d'un allele 
pourrait avoir un effet dominant dans les celules de 
l'ectoderme neural • Puisqu'un allele seulement 
produirait la proteine Hox-3.1, le signal 
d 1 activation serait dilue sur les deux promoteurs. La 

10 reduction d'autoinactivation dans les deux loci 
pourrait ainsi conduire a un arret total de 
l 1 initiation de transcription. Ceci pourrait 
expliquer pourguoi aucune expression de Lac Z n'a 6te 
detectee dans la region cervicale du tube neural 

15 d 1 embryons de 10.5 et 12.5 jours. 

V - Passage de la modification dans la lignSe 
cellulaire qerminale ; production d'animaux 
transqeniques 

Les effets en F t et en F 2 de la modification 

20 apportde par I 1 insertion ciblee ont ete observes 
apres reproduction des chimeres. Le passage de la 
modification dans la lignee cellulaire germinale a 
6t6 constate. 
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REVENDICATIONS 
1. Precede de remplacement specif ique, d'un gene 
notamment par ciblage d'un ADN, dit ADN d» insertion 
constitue par une partie d'un gene susceptible d'etre 
5 rendu fonctionnel, ou dont le fonctionnement peut 
itre rendu plus efficace, lorsqu'il est recombine 
avec un ADN de complement pour alors fournir un gene 
recombinant complet dans le genome d'une cellule 
eucaryote, caracterise en ce que 

- le site d« insertion se trouve dans un gene choisi, 
dit gene receveur choisi, et contenant 1 'ADN de 
complement, et en ce que 

- l'on transfecte des cellules eucaryotes avec un 
vecteur contenant un inserat comprenant lui-meme 

15 1'ADN d' insertion et deux sequences dites 
"flanquantes" de part et d'autre de 1'ADN 
d' insertion, respectivement homologues a deux 
sequences genomiques qui jouxtent le site d' insertion 
souhaite dans le gene receveur, 

- 1'ADN d- insertion etant heterologue vis-a-vis du 
gene receveur, et 

- les sequences flanquantes, etant choisies parmi 
celles qui constituent le susdit ADN de complement et 
qui autorisent, par recombinaison homologue avec des 
sequences correspondantes du gene receveur, la 
reconstitution d'un gene recombinant complet dans le 
genome de la cellule eucaryote. 

2. Precede selon la revendication 1, ledit ADN 
d' insertion contenant soit une sequence codante soit 
une sequence regulatrice, caracterise- en ce que 

- le site d» insertion se trouve dans un gene choisi 
dit gene receveur et en ce que 

- l'on transfecte des cellules eucaryotes avec un 
vecteur contenant un inserat comprenant lui-meme 

35 1'ADN d'insertion et deux sequences dites 
" flanquantes" de part et d'autre de 1'ADN 
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d 1 insertion, respectivement homologues a deux 
sequences genomigues qui jouxtent le site d 1 insertion 
souhaite dans le gene receveur, 

- l.'ADN d' insertion 6tant heterologue vis-a-vis du 
5 gene receveur et, 

- les sequences flanquantes 6tant choisies afin de 
permettre par recombinaison homologue selon le cas, 
soit l 1 expression de la sequence codante de l'ADN 
d 1 insertion entier sous le controle des sequences 

10 regulatrices du gene receveur, soit 1' expression 
d'une sequence codante du gene receveur sous le 
controle de sequences regulatrices de l'ADN 
d 1 insertion, 

3. Procede selon la revendication 1 ou 2, 
15 caracterise en ce que l'ADN d 1 insertion contient une 

sequence codante depourvue d 1 element de regulation, 
notamment d'un promoteur qui lui est propre. 

4. Procede selon l*une quelconque des 
revendications 1 a 3, caracterise en ce que le gene 

20 receveur est present dans le genome de la cellule 
eucaryote en au moins deux exemplaires. 

5. Proc6d6 selon l'une quelconque des 
revendications 1 a 4, caracterise en ce que chacune 
des sequences flanquantes a une longueur superieure a 

25 iso paires de bases, et inferieure a la longueur du 
gene receveur. 

6. Procede selon l'une quelconque des 
revendications 1 a 5, caractdrisd en ce que les 
cellules eucaryotes sont des cellules souches 

30 embryonnaires (E,S.)« 

7. Procede selon l'une des revendications 
precedentes, caract£ris6 en ce que le gene 
d 1 insertion est un gene heterologue k l'espece 
trans fectee, 

35 8. Proc6d6 selon l"une des revendications 

precedentes, caracterise en ce que le vecteur 



FEUILLE DE RZfvlPLACEiVIENT 



WO 90/11354 



PCT/FR90/00185 



37 

contient des sequences intercaldes entre le gene 
d 1 insertion et les sequences flanquantes. 

9. Procddd selon la revendication 8, caracterise 
en ce que les sequences intercalantes contiennent une 

5 sequence codant pour un agent sdlectif pennettant la 
selection des transformants et dventuellement un gene 
marqueur par exemple le LacZ. 

10. Procdde selon l"une des revendications 
precedentes, caracterise en ce que la transfection 

?fl est effectuee par electroporation. 

11. Procdde selon I'une des revendications 
precedentes, caracterise en ce que la technique de 
Polymerase Chain Reaction (P.C.R.) est utilisee pour 
amplifier la sequence d'ADN du locus ou se fait 

15 1* insertion pour verifier que l f insertion a eu lieu 
dans le site souhaite. 

12. Procede selon la revendication 1, caracterise 
en ce que l'ADN d 1 insertion comporte, entre les 
sequences flanquantes, d'une part une sequence d'ADN 

20 destinee a etre recombinee avec l'ADN de complement 
dans le gene receveur pour fournir un gene 
recombinant, et, d' autre part, une sequence codant 
pour un agent selectif permettant la selection des 
transformants et un promoteur autorisant 1 'expression 

25 de 1' agent selectif, le gene receveur et le gene 
recombinant codant pour des produits d f expression ne 
conferant pas de phenotype selectable. 

13. Procede de production d f animaux 
transgeniques , caractdrisd en ce que des cellules 

30 e.S. sont transfectdes par le procddd selon l'une des 
revendications 1 a 12 et selectionnees pour 
1'evenement de recombinaison homologue, a savoir 
1 1 integration correcte du gene dtranger, les cellules 
sont injectees dans des embryons & un stade ou ils 

35 sont aptes a integrer les cellules transfectees, par 
exemple au stade blastocyste, ceux-ci sont ensuite 
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reimplantes dans une mere porteuse et, les individus 
chimeres obtenus au tenne de la gestation et chez 
lesquels est constate la colonisation par les 
cellules E.S. de la lignee germinale, sont accouples 
5 pour obtenir des animaux transgdniques heterozygotes 
pour le gene remplacd. 

14. Plasmide apte a effectuer 1' insertion ciblee 
d'un gene dit gene d 1 insertion dans le genome d'une 
cellule eucaryote, caractdrise en ce qu'il contient 

10 un inserat comprenant lui-meme le gene d 1 insertion et 
deux sequences dites "flanquantes" de part et d' autre 
du gene d 1 insertion, respectivement homologues aux 
deux sequences genomiques qui jouxtent le site 
d' insertion souhaite dans le gene receveur. 

15 15 •Plasmide selon la revendication 14 , 

caracterise en ce que l 1 inserat comprend, entre les 
sequences flanquantes, d'une part une sequence d'ADN 
destinee a etre recombinde avec I'ADN de complement 
dans le gene receveur, et, d' autre part, une sequence 

20 codant pour un agent select if permettant la selection 
des transformants et un promoteur autorisant 
I'expression de l'agent sdlectif, la sequence d'ADN 
destinee a etre recombinde avec l'ADN de complement 
etant autre qu'un gene codant pour un agent selectif. 

25 16. Plasmide pGN comme illustre dans la 

figure l. 

17. Cellules eucaryotes transformees par le 
procddd de la revendication 1. 

18. cellules selon la revendication 17 
30 caractdrisees en ce que ce sont des cellules E.S. 

19. Animal transgdnique dans lequel une seule 
copie d f un gdne qui est prdsent dans le genome a au 
moins deux exemplaires, a dtd inactive par 
1' insertion d'un gfene qui est different du gene • 

35 inactive, le gene d' insertion dtant insere dans une 
position qui permet 1' expression de ce gene sous le 
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controle des sequences regulatrices du gene endogene 
inactive. 

20. Application du procede selon l'une 
guelcongue des revendications 1 a 12 pour la therapie 
genique . 

21. Application du procede selon l'une 
guelcongue des revendications 1 a 12 pour la 
production d'animaux transgenigues . 

22. Application du procede de la revendication 9 
pour marguage genet igue d'animaux. 

23. Application du procede de la revendication 
13 pour le criblage de produits pharmaceutics 
presumes avoir une activite a l'egard des produits 
d« expression d'un gene pathologique lie a une 
maladie, caracterisee en ce que le gene d' insertion 
est constitue par le gene pathologique ou un fragment 
de celui-ci et en ce gue l'on administre a 1- animal 
transgenigue le produit pharmaceutique a tester, en 
vue d'evaluer son activite sur la maladie. 
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polyA SV40: 

signal de polyadenylation du virus 
SV 40 

Ori: 

origine de replication bacterienne 
PyF9.1Eqh.: 

sequence acuvatrice de la soucfae 

LTR-RSV - U VirUS dU Pol7ome 
"Long Terminal Repeat" du virus du 
sarcome de Rous 

Tn5 promoter : 

promoteur bacteriea 
Neo*: 

Phase codante de la Phosphotransferase 
PolyA SV40 

MCS: site de donage multiple 



Figure 1: plasmide lineaire 
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